Desafio III
Estatística Espacial I
1 Objetivo
O estudo se baseia no conjunto de dados provenientes do CENSO Demográfico de 2010, realizado pelo Instituto Brasileiro de Geografia e Estatística (IBGE), e foram retirados da plataforma TABNET do Departamento de Informática do Sistema Único de Saúde (DATASUS), com enfoque no estado do Rio de Janeiro.
Os pesquisadores Igor Freitas e João Pedro Fernandes vão prestar uma consultoria à Secretaria de Saúde do Governo do estado do Rio de Janeiro e estão encarregados de analisar se a taxa de analfabetismo no estado do RJ em 2010 (ano do último CENSO) pode ser modelada por um modelo de dependência espacial com base na taxa de desemprego e de trabalho infantil, sendo que essa variáveis podem ser definidas como:
taxa de analfabetismo: Percentual da população de 15 anos ou mais que não sabe ler e escrever;
taxa de desemprego: Percentual da população de 16 anos ou mais, economicamente ativa (PEA), desocupada;
taxa de trabalho infantil: Percentual da população de 10 a 15 anos ocupada.
2 Análises exploratórias
2.1 Parte I
Os dados totalizam 92 observações referentes à localização geográfica, à identificação e às variáveis de interesse para os 92 municípios do Rio de Janeiro.
Analisando histogramas, chega-se à conclusão que os valores da taxa de analfabetismo têm comportamento assimétrico à direita, com maior variabilidade, já que há pontos cujos valores muito altos (outliers). Já o log da taxa apresenta comportamento se assemelhando à distribuição normal, diminuindo a variabiidade, corrigindo a assimetria e estabilizando um pouco a incerteza. Dessa forma, escolhe-se modelar o logaritmo da taxa.
2.2 Parte II
2.2.1 Log (taxa de analfabetismo) x taxa de desemprego
não dá para perceber alguma relação tão evidente entre as variáveis
parece que as menores taxas de desemprego se encontram na região serrana e no interior do estado